iT邦幫忙

2023 iThome 鐵人賽

DAY 23
1

激活層資料模型範例

用一個比較簡單的與常見的使用案例來做範例,假設某一個公司的商業模型如下:

  • 客戶獲取(Customer Acquisition)和客戶引導(Customer Onboarding)在 Hubspot 上完成
  • 售後服務和客戶問題是通過Zendesk來處理
  • 多頻道客戶溝通(Multi-Channel Customer Engagement)主要通過Braze

在這種情況下,大部分的資料倉儲需求可以用Fivetran + Snowflake + dbt來完成,而我們也可以假設已完成了一個簡單的資料倉庫項目。

在這種狀況下,建構資料激活層則是上述資料棧的邏輯衍生,也是最容易體現資料倉庫的價值的辦法。在維持低人力成本與快速完成的前提下,rETL工具則是最合理的選擇。

利用Fivetran dbt Package 的 Hubspot rETL

為不熟悉Fivetran的人解釋一下:Fivetran 是一個用於現代數據棧的資料擷取的一體化解決方案,主要提供許多鏈接SaaS工具和數據庫的預建資料鏈接器(Data Connectors)。而預先配置好的鏈接器,可將資料從各種來源提取到數據倉庫或數據湖。

對使用dbt的人來說,除了本身的功能以外,最大的賣點就是可以通過Fivetran預設的資料模型package來簡單完成資料倉庫裡的資料模型。

因為這篇文章的主題是資料激活層和rETL,我們就假設所有的客戶級資料是用了Fivetran的hubspot_sourcehubspot來完成:

  • hubspot_source:對應了資料整合層(Data Integration / Staging Layer)
  • hubspot:對應了資料集市層

對 dbt 或 data 有興趣 :wave:?歡迎加入 dbt community 到 #local-taipei 找我們,也有實體 Meetup 請到 dbt Taipei Meetup 報名參加


上一篇
Reverse ETL & C-CDP:活化你的資料倉庫 Part 4
下一篇
Reverse ETL & C-CDP:活化你的資料倉庫 Part 6
系列文
實用Modern Data Stack:資料架構案例分析與分享30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言